当前位置: 开发笔记 > 编程语言 > 正文

尺寸|估计值_MOT综述(2021)

作者：sunsijia | 来源：互联网 | 2023-06-29 21:56

篇首语：本文由编程笔记#小编为大家整理，主要介绍了MOT综述(2021)相关的知识，希望对你有一定的参考价值。@TOC1.简介

篇首语：本文由编程笔记#小编为大家整理，主要介绍了MOT综述 (2021)相关的知识，希望对你有一定的参考价值。

&＃64;TOC

1. 简介

参考论文《Analysis Based on Recent Deep Learning Approaches Applied in Real-Time Multi-Object Tracking: A Review》
JDE&＃xff1a;Joint Detection and Embedding &＃xff08;一阶段&＃xff1a;一个端到端的网络同时输出检测结果和对应检测Box的外观特征向量&＃xff09;
SDE&＃xff1a;Separate Detection and Embedding &＃xff08;两阶段&＃xff1a;先检测Box&＃xff0c; 然后再计算检测Box对应的外观特征向量&＃xff09;
MOT方法分类&＃xff1a;
- 在线方法&＃xff08;Online Method&＃xff09;&＃xff1a;只使用当前和过去的信息
- 批处理方法&＃xff08;Batch Method&＃xff09;&＃xff1a;使用未来的信息

1.1 轨迹与检测Box的关联特征

运动特征&＃xff08;motion&＃xff09;
外观特征&＃xff08;appearance&＃xff09;
位置特征&＃xff08;location&＃xff09;

1.1 MOT挑战

人体姿势、摄像机视角、照明、遮挡、分辨率、背景杂乱和其他意外场景的复杂变化频繁发生
人员拥挤并快速移动 (crowded scenes and fast motion, 如长跑)

1.2 轻量级网络

SqueezeNet&＃xff1a;通过使用 1×1 卷积层“挤压”特征图通道来实现更高的运行速度
MobileNet&＃xff1a; 通过使用低成本的深度卷积层和逐点卷积层替换高资源消耗的卷积层来减少运行时间
ShuffleNet&＃xff1a;通过减少element-wise算子和平衡输入输出通道&＃xff0c;在推理过程中降低了MAC&＃xff08;Memory Access Cost&＃xff09;&＃xff0c;进一步提高了网络运行速度

2. 方法汇总及分类

3. FairMOT

FairMOT&＃xff1a;使用外观特征可以执行长距离的关联&＃xff0c;而且可以处理遮挡情况

3.1 One-shot跟踪器中的不公平性问题

3.1.1 Anchors导致的不公平

基于anchor的设计不适合学习re-ID特征&＃xff0c;尽管检测结果很好&＃xff0c;但会导致大量的ID切换,其原因如下&＃xff1a;
- re-ID任务得不到公平的学习&＃xff1a;导致re-ID特征质量不高
- 一个Anchor对应多个目标&＃xff1a;提取的特征在准确性和有区别地表示目标对象方面不是最优的
- 多个Anchors包含同一个目标&＃xff1a;一个具体的目标取哪一个Anchor很难准确判断

3.1.2 特征导致的不公平

大部分特征在对象检测和re-ID任务间共享&＃xff0c;但不同任务需要不同层次的特征
- 对象检测&＃xff1a;需要深层抽象特征估计对象的类别和位置
- re-ID任务&＃xff1a;需要浅层外观特征&＃xff0c;以区分相同类别的不同实例
从多任务损失函数优化的角度看&＃xff0c;对象检测与re-ID的优化目标是冲突的&＃xff0c;所以必须有对应的策略来平衡这个优化

3.1.3 特征维度导致的不公平

以前的re-ID&＃xff0c;为了在benchmarks上获得好的效果&＃xff0c;经常学习高维的特征向量
对于one-shot MOT&＃xff0c;学习低维特征更好的理由&＃xff1a;
- 高维 re-ID 特征显着损害目标检测精度&＃xff1a;由于两个任务的竞争&＃xff0c;从而对最终跟踪精度产生负面影响 &＃xff08;对象检测的特征维度很低&＃xff1a;类别号&＃43;box位置&＃xff09;&＃xff0c;所以需要学习低维re-ID特征以平衡这两个任务
- MOT任务不同于re-ID任务&＃xff1a;MOT任务在相邻两帧间执行1到1匹配&＃xff0c;而re-ID任务需要查询大量的候选项&＃xff0c;因此需要更高维的特征
- 学习低维特征可以提高推理速度

3.2 FairMOT网络组成

FairMOT主要由以下三部分组成&＃xff1a;
- 主干网络
- 对象检测分支
- re-ID分支

3.2.1 主干网络&＃xff08;Backbone Network&＃xff09;

为取得最佳的准确度和速度&＃xff0c;主干网络使用ResNet-34&＃xff0c;把深层聚合&＃xff08;DLA&＃xff1a;Deep Layer Aggregation&＃xff09;应用到主敢网络以融合多层特征。不同于原始的DLA&＃xff0c;在低级与高级特征间有更多skip链接&＃xff0c;类似于特征金字塔&＃xff08;FPN&＃xff1a;Feature Pyramid Network&＃xff09;

3.2.2 检测分支&＃xff08;Detection Branch&＃xff09;

检测分支构建于CenterNet之上&＃xff0c;三个并行的heads附加在DLA-34上&＃xff0c;用于分别估计&＃xff1a;
- heatmaps
- object center offsets
- bounding box sizes
每个head把具有256个channels的3x3卷积应用于DLA-34输出的特征图上&＃xff0c;然后由一个1x1的卷积层输出最后的结果

3.2.2.1 热图头&＃xff08;Heatmap Head &＃xff09;

此热图头负责估计对象中心的位置
如果热图中某个位置的响应与真实对象中心重合&＃xff0c;则该位置的响应预计为 1
响应随着热图位置和对象中心之间的距离呈指数衰减
对于图像中的真实Box的位置&＃xff1a;
$b^i &＃61; (x_1^i, y_1^i, x_2^i, y_2^i)$
则对象的中心为&＃xff1a;
$(c_x^i, c_y^i) &＃61; (\\fracx_1^i &＃43; x_2^i2, \\fracy_1^i &＃43; y_2^i2 )$
对象中心在特征图中的坐标为&＃xff1a;
$(\\widetilde c_x^i, \\widetilde c_y^i) &＃61; (\\lfloor \\fracc_x^i4 \\rfloor, \\lfloor \\fracc_y^i4 \\rfloor)$

xi,c

yi)&＃61;(⌊4cxi⌋,⌊4cyi⌋)
热图在位置 $(x, y)$ 处的响应为&＃xff1a;
$M_xy &＃61; \\sum_i&＃61;1^N exp^-\\frac(x - \\widetilde c_x^i)^2 &＃43; (y - \\widetilde c_y^i)^22 \\sigma_c^2$

xi)2&＃43;(y−c

yi)2
- N&＃xff1a;表示图像中对象的个数
- $\\sigma_c$ &＃xff1a;表示标准偏差
热图的损失函数&＃xff1a;定义为具有焦点损失&＃xff08;focal loss&＃xff09;的像素级逻辑回归
$L_heat &＃61; - \\frac1N \\sum_xy \\begincases (1 - \\hat M_xy)^\\alpha log (\\hat M_xy), & \\textif $M_xy&＃61;1$ \\\\ (1 - M_xy)^\\beta(\\hat M_xy)^\\alpha log (1- \\hat M_xy), & \\textotherwise \\endcases \\quad (1)$
- $\\hat M$ &＃xff1a;是估计的热图
- $M$ &＃xff1a;是真实的热图
- $\\alpha, \\beta$ &＃xff1a;是focal loss中预定义的参数

3.2.2.2 检测框偏移量头&＃xff08;Box Offset Head&＃xff09;

检测框偏移量头&＃xff1a;使目标的定位更加准确
由于最终特征图的步幅为四&＃xff0c;因此将引入多达四个像素的量化误差。该分支估计每个像素相对于对象中心的连续偏移&＃xff0c;以减轻下采样的影响。
检测框偏移量头输出的估计值:
$var cpro_id = "u6885494";$

编程

object

view

join

io

深度

ip

branch

heatmap

写下你的评论吧 !

吐个槽吧,看都看了

会员登录 | 用户注册

推荐阅读

python
的错误消息：

ZSI.generate.Wsdl2PythonError: unsupported local simpleType restriction ... [详细]

蜡笔小新   2023-12-13 20:28:08

sum
SpringJdbcTemplate的使用详解

本文详细介绍了Spring的JdbcTemplate的使用方法，包括执行存储过程、存储函数的call()方法，执行任何SQL语句的execute()方法，单个更新和批量更新的update()和batchUpdate()方法，以及单查和列表查询的query()和queryForXXX()方法。提供了经过测试的API供使用。 ... [详细]

蜡笔小新   2023-12-13 14:27:11

数组
Java中vector的使用详解

本文详细介绍了Java中vector的使用方法和相关知识，包括vector类的功能、构造方法和使用注意事项。通过使用vector类，可以方便地实现动态数组的功能，并且可以随意插入不同类型的对象，进行查找、插入和删除操作。这篇文章对于需要频繁进行查找、插入和删除操作的情况下，使用vector类是一个很好的选择。 ... [详细]

蜡笔小新   2023-12-13 14:14:39

sum
也就是|小窗_卷积的特征提取与参数计算

篇首语：本文由编程笔记#小编为大家整理，主要介绍了卷积的特征提取与参数计算相关的知识，希望对你有一定的参考价值。Dense和Conv2D根本区别在于，Den ... [详细]

蜡笔小新   2023-12-13 12:59:48

io
Oracle seg,V$TEMPSEG_USAGE与Oracle排序的关系及使用方法

本文介绍了Oracle seg,V$TEMPSEG_USAGE与Oracle排序之间的关系，V$TEMPSEG_USAGE是V_$SORT_USAGE的同义词，通过查询dba_objects和dba_synonyms视图可以了解到它们的详细信息。同时，还探讨了V$TEMPSEG_USAGE的使用方法。 ... [详细]

蜡笔小新   2023-12-12 17:57:15

list
向QTextEdit拖放文件的方法及实现步骤

本文介绍了在使用QTextEdit时如何实现拖放文件的功能，包括相关的方法和实现步骤。通过重写dragEnterEvent和dropEvent函数，并结合QMimeData和QUrl等类，可以轻松实现向QTextEdit拖放文件的功能。详细的代码实现和说明可以参考本文提供的示例代码。 ... [详细]

蜡笔小新   2023-12-14 16:06:38

io
单击后为什么远程通知操作无效？ - Why remote notification action is doing nothing after clicking?

IhaveconfiguredanactionforaremotenotificationwhenitarrivestomyiOsapp.Iwanttwodiff ... [详细]

蜡笔小新   2023-12-14 15:57:44

sum
HDU 2372 El Dorado（DP）的最长上升子序列长度求解方法

本文介绍了解决HDU 2372 El Dorado问题的一种动态规划方法，通过循环k的方式求解最长上升子序列的长度。具体实现过程包括初始化dp数组、读取数列、计算最长上升子序列长度等步骤。 ... [详细]

蜡笔小新   2023-12-14 15:08:18

sum
IB 物理真题解析：比潜热、理想气体的应用

本文是对2017年IB物理试卷paper 2中一道涉及比潜热、理想气体和功率的大题进行解析。题目涉及液氧蒸发成氧气的过程，讲解了液氧和氧气分子的结构以及蒸发后分子之间的作用力变化。同时，文章也给出了解题技巧，建议根据得分点的数量来合理分配答题时间。最后，文章提供了答案解析，标注了每个得分点的位置。 ... [详细]

蜡笔小新   2023-12-14 15:00:29

io
OC学习笔记之@property和@synthesize

本文介绍了OC学习笔记中的@property和@synthesize，包括属性的定义和合成的使用方法。通过示例代码详细讲解了@property和@synthesize的作用和用法。 ... [详细]

蜡笔小新   2023-12-14 12:05:06

list
关于cuowu类的错误提示和使用AdjustmentListener的问题

本文讨论了一个关于cuowu类的问题，作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案，并给出了两个可能导致错误的原因。 ... [详细]

蜡笔小新   2023-12-13 22:09:56

io
scrapy存入excel时，excel文件被反复擦除重写。文件大小始终不超过100k，请问这种情况改如何解决

怀疑是每次都在新建文件，具体代码如下 ... [详细]

蜡笔小新   2023-12-13 17:53:49

list
XML介绍与使用的概述及标签规则

本文介绍了XML的基本概念和用途，包括XML的可扩展性和标签的自定义特性。同时还详细解释了XML标签的规则，包括标签的尖括号和合法标识符的组成，标签必须成对出现的原则以及特殊标签的使用方法。通过本文的阅读，读者可以对XML的基本知识有一个全面的了解。 ... [详细]

蜡笔小新   2023-12-13 17:39:50

sum
[大整数乘法] java代码实现

本文介绍了使用java代码实现大整数乘法的过程，同时也涉及到大整数加法和大整数减法的计算方法。通过分治算法来提高计算效率，并对算法的时间复杂度进行了研究。详细代码实现请参考文章链接。 ... [详细]

蜡笔小新   2023-12-13 11:21:32

sum
关于Linq to sql 实现模糊查询 string数组

前景：当UI一个查询条件为多项选择，或录入多个条件的时候，比如查询所有名称里面包含以下动态条件，需要模糊查询里面每一项时比如是这样一个数组条件：newstring[]{兴业银行, ... [详细]

蜡笔小新   2023-12-13 09:34:59

sunsijia

业精于勤荒于嬉

Tags | 热门标签

int

io

erlang

python

search

integer

md5

hashcode

fetch

vbscript

hook

数组

dll

request

install

spring

char

list

blob

flutter

plugins

cmd

grid

web3

typescript

subset

byte

sum

split

keyword

RankList | 热门文章

1.Net框架中，.ashx页面访问session

2牛客练习赛24(石子阵列,PH试纸,插排树,青蛙)

3自动化测试工程师的发展前景怎么样？好不好？

4电脑录制扬声器_如何将iPad/iPhone作为电脑的扬声器

5vscode配置python3开发环境_vscode 配置 python3开发环境的方法

6java编程删除相同字符,[剑指offer]删除在另一个字符串中出现的字符

7objc_msgSend 报错

8windows7系统盘的简单介绍

9OpenGL 4.0 GLSL 采用平行光照模型

10安装oracle出现error：ora-01031：insufficient privilleges的解决

11vb.net语法入门,VB 语法

12Java枚举类型的用法

13若依微服务版之新建子模块

1420165306 Exp9 Web安全基础

15Android资源编译和打包过程分析